Séparateurs à Vaste Marge Optimisant la Fonction Fbeta
نویسندگان
چکیده
Dans cet article, nous introduisons une nouvelle paramétrisation des Séparateurs à Vaste Marge (SVM) appelée Fβ SVM. Cette dernière permet d’effectuer un apprentissage basé sur l’optimisation de la fonction Fβ au lieu de l’erreur de classification habituelle. Les expériences montrent les avantages d’une telle démarche par rapport à la formulation soft-margin standard (avec les écarts à la marge au carré) lorsque l’on accorde une importance différente à la précision et au rappel. Une procédure automatique basée sur le score Fβ de généralisation est ensuite introduite pour sélectionner les paramètres du modèle. Cette procédure repose sur les résultats de Chapelle, Vapnik et al. (Chapelle et al., 2002) concernant l’utilisation de méthodes basées sur le gradient dans le cadre de la sélection de modèles. Les dérivées de la fonction de perte Fβ par rapport à la constante de régularisation C et à la largeur σ d’un noyau gaussien sont définies formellement. A partir de là, les paramètres du modèle sont sélectionnés en effectuant une descente de gradient de la fonction de perte Fβ dans l’espace des paramètres. Les expériences sur des données réelles montrent les bénéfices de cette approche lorsque l’on cherche à optimiser le critère Fβ .
منابع مشابه
Identification Biométrique des Individus par leurs Empreintes Palmaires «Palmprints»: Classification par la Méthode des Séparateurs à Vaste Marge (SVM)
Résumé. L’identification des individus par leurs empreintes palmaires (Palmprints), considérée comme nouveau membre de la famille des modalités biométriques, est devenue un domaine de recherche très actif durant ces dernières années. Les travaux réalisés, jusqu’à présent, se sont basés sur les techniques de représentation des images de palmprints pour une meilleure classification. Dans notre tr...
متن کاملUn nouvel algorithme de forêts aléatoires d'arbres obliques particulièrement adapté à la classification de données en grandes dimensions
Résumé. L’algorithme des forêts aléatoires proposé par Breiman permet d’obtenir de bons résultats en fouille de données comparativement à de nombreuses approches. Cependant, en n’utilisant qu’un seul attribut parmi un sous-ensemble d’attributs tiré aléatoirement pour séparer les individus à chaque niveau de l’arbre, cet algorithme perd de l’information. Ceci est particulièrement pénalisant avec...
متن کاملVers des Machines à Vecteurs Support "Actionnables" : Une Approche Fondée sur le Classement
Résumé. Une des principales critiques que l’on puisse faire aux Séparateurs à Vaste Marge (SVM) est le manque d’intelligibilité des résultats. En effet, il s’agit d’une technique “boite noire” qui ne fournit pas d’explications ni d’indices quant aux raisons d’une classification. Les résultats doivent être pris tels quels en faisant confiance au système qui les a produits. Pourtant selon notre e...
متن کاملBoîte à outils SVM simple et rapide
RÉSUMÉ. Si les SVM (Support Vector Machines, ou Séparateurs à Vaste Marge) sont aujourd’hui reconnus comme l’une des meilleures méthodes d’apprentissage, ils restent considérés comme lents. Nous proposons ici une boîte à outils Matlab permettant d’utiliser simplement et rapidement les SVM grâce à une méthode de gradient projeté particulièrement bien adaptée au problème : SimpleSVM [VIS 03]. Nou...
متن کاملSéparateurs à Vaste Marge pondérés en norme L2 pour la sélection de variables en apprentissage d'ordonnancement
Learning to rank algorithms are dealing with a very large amount of features to automatically learn ranking functions, which leads to an increase of both the computational cost and the number of noisy redundant features. Feature selection is seen as a promising way to address these issues. In this paper, we propose new feature selection algorithms for learning to rank based on reweighted `2 SVM...
متن کامل